Les débuts maladroits des vidéos générées par l’intelligence artificielle


L’intelligence artificielle (IA) est déjà employée pour divers usages en vidéo, notamment pour mettre des personnages publics dans des situations déplacées ou pour leur faire tenir des propos fallacieux – une manipulation qui porte le nom « deepfake » et s’avère, année après année, toujours plus simple à réaliser. Mais des chercheurs et des entreprises travaillent à un autre projet : générer des séquences animées ex nihilo, en décrivant le résultat recherché avec des mots simples, comme « un chat noir plonge dans une baignoire de lait ».

Dès 2022, des tentatives ont abouti chez Google et Meta. Ces grandes entreprises ont choisi de ne pas rendre ces outils publics, notamment par peur des manipulations qui pourraient résulter de leur usage. Mais d’autres ont conçu des outils semblables, tels ModelScope, Kaiber ou Runway. Avec un succès variable : beaucoup des vidéos réalisées par leur biais et qui circulent sur les réseaux sociaux se distinguent avant tout par leurs imperfections.

Assemblages de plans trop courts et trop statiques, décors trop plats, détails approximatifs et, surtout, des objets et des personnages maladroitement esquissés : ils rappellent ce dont était capable Midjourney, l’intelligence artificielle génératrice d’images aujourd’hui quasi photoréalistes, il y a encore huit mois. Çà et là apparaissent des étrangetés : visages difformes, yeux révulsés, corps désarticulés. Des internautes s’en plaignent ou s’en amusent, comme cet utilisateur de Twitter qui félicite l’auteur d’un très improbable western de lui avoir « officiellement cassé le cerveau ». Ailleurs, une parodie de publicité pour la bière montre une femme, la bouche rivée sur le métal d’une canette géante, qui boit avec l’avidité d’un animal dans un jardin en flammes. Un autre internaute résume le ton des commentaires : « C’est à la fois la chose la plus hilarante et la plus terrifiante que j’ai jamais vue. »

Des outils très jeunes

En cherchant bien, il est possible de dénicher des vidéos convaincantes, souvent dans l’univers de la science-fiction. Un genre qui s’y prête, l’IA arrivant déjà à bien représenter les robots et autres décors étranges. Autre vidéo : celle d’un trois-mâts naviguant sous une voûte céleste avec une abondance de détails. Le pont du bateau se recompose plusieurs fois par seconde, ce qui paraît lui donner vie. Un fourmillement caractéristique de l’outil Kaiber.

Dans les mains expertes d’un chercheur en IA, son concurrent Runway Gen-2 a produit une publicité imaginaire vantant les mérites de la colonisation martienne. L’intrigue est adroitement servie par les plans de l’IA, revisitant avec bonheur l’ambiance graphique des années 1950, imaginant une architecture fantasque.

Il vous reste 54.1% de cet article à lire. La suite est réservée aux abonnés.



Source
Catégorie article Politique

Ajouter un commentaire

Commentaires

Aucun commentaire n'a été posté pour l'instant.